iT邦幫忙

2025 iThome 鐵人賽

DAY 17
0
生成式 AI

AI 給我錢錢錢 ! AI 股神養成計劃系列 第 17

Day 17: 說人話吧!讓 AI 幫你自動加註解、寫摘要

  • 分享至 

  • xImage
  •  

在前幾天,我們已經能夠讓 AI 幫我們蒐集財經新聞、產生投資報告,甚至輸出成 Word、PDF 檔案。
不過,有沒有覺得這些報告常常「資訊太多、太硬、太專業」?
今天,我們就要來讓 AI 幫我們「翻譯成人話」,自動幫投資報告加上註解,並且生成摘要,讓你用更輕鬆的方式理解市場趨勢!

抓取新聞

我從 finance.yahoo 去找尋最近的新聞,並且下載為pdf檔,方便之後去做讀取,本篇是10頁的pdf,剛好負荷不會太大。
https://ithelp.ithome.com.tw/upload/images/20250828/20169444sAIBO76hhW.png

實作

這裡我們延續之前產生報告的程式,加入 自動摘要與註解 功能。
但不一樣的是,我們抓取新聞是pdf檔,所以讀取變成pdf的資料,在Python 常用的工具是 PyPDF2 或 pdfplumber。

但途中我遇到了Gemini讀取不到我的pdf檔,我找了一下原因,發現我的pdf檔是掃描檔且有圖片,所以會造成無法讀取,所以我先用OCR來幫我抓文字,再把文字丟進 Gemini 做摘要 & 加註解。

import google.generativeai as genai
import pdfplumber
import pytesseract
from pdf2image import convert_from_path

# === 設定 API ===
genai.configure(api_key="YOUR_GEMINI_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")

pdf_path = "news.pdf"
report_text = ""

# === Step 1. 嘗試用 pdfplumber 抓文字 ===
with pdfplumber.open(pdf_path) as pdf:
    for page in pdf.pages:
        text = page.extract_text()
        if text:
            report_text += text + "\n"

# === Step 2. 如果是掃描 PDF(文字抓不到),就用 OCR ===
if not report_text.strip():
    print("⚠️ PDF 沒有內嵌文字,改用 OCR 處理...")
    pages = convert_from_path(pdf_path)
    for page in pages:
        report_text += pytesseract.image_to_string(page, lang="chi_tra+eng") + "\n"

# 確認文字
print("📖 PDF 內容(前 500 字):\n", report_text[:500])

# === Step 3. 丟進 Gemini 自動加註解 ===
annotated = model.generate_content(f"""
請幫我針對以下內容自動加上註解,對於財經術語提供簡單說明:
{report_text}
""")

# === Step 4. Gemini 摘要生成 ===
summary = model.generate_content(f"""
請針對以下投資報告內容,生成三種層級的摘要:
1. 一句話摘要
2. 三段摘要
3. 條列式摘要
內容如下:
{report_text}
""")

print("📌 自動加註解:\n", annotated.text)
print("\n📌 摘要生成:\n", summary.text)

輸出結果

https://ithelp.ithome.com.tw/upload/images/20250828/20169444wK3iJIUTSS.png

https://ithelp.ithome.com.tw/upload/images/20250828/20169444GgJI0uloer.png

pdfplumber 比 PyPDF2 在表格、段落處理上更準確。

如果 PDF 很大(例如完整年報),建議 分頁處理分段摘要,再讓模型合併,避免超過 token 限制。

結語

從今天開始,我們不只會「收集資訊」,還能讓 AI 幫我們整理出「看得懂」的投資重點。
這大大節省了時間,尤其是對於不熟悉財經術語的人來說,就像是有個專屬的翻譯助手!
👉 明天(Day 18),明天我們將把投資資訊變成 圖表與視覺化結果,文字有時候還是太抽象,讓數據一目了然!


上一篇
Day 16: Word?PDF?通通給我生成!AI 投資報告排版大進化
下一篇
Day 18: 股市看不懂?來點 AI 繪圖,圖表一秒出爐
系列文
AI 給我錢錢錢 ! AI 股神養成計劃20
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言